4.3 容忍区间与容忍限

容忍区间和区间估计并没有共同之处, 只是解有形式上的相似性.

1 背景与定义

如果某工厂生产一种产品, 质量指标 XN(a,σ2) (假设都已知). 给定 β(0,1) (通常很小). 以 F(x;a,σ)N(a,σ2) 的分布函数, 则可以找到很多 b1<b2: (1.1)F(b2;a,σ)F(b1;a,σ)1β,(b1,b2)=(aσuβ2,a+σuβ2). 又可以定义 b3<b4: (1.2)F(b3;a,σ)β,F(b4;a,σ)1β,(b3,b4)=(aσuβ,a+σuβ).
这个例子的意义是, 如果指定某个指标需要满足要求在 B1,B2 之间才算合格, 且指定 β=0.01 (合格率至少为 99%), 则能否找到 b1,b2, 使得 (1.1) 成立, 且 B1b1<b2B2?

如果 a,σ 已知, 则这里没有统计问题. 否则, b1b4 需要根据 X 来估计. 比如如果有估计量 b^i(X1,,Xn)=b^i, 则能否有 F(b^2;a,σ)F(b^1;a,σ)1β? 由于随机性, 我们只能降低到这个事件的概率 1γ. 这就引导出容忍区间/容忍限的概念.

XF(x), 分布未知. X1,,Xni.i.dX. 给定 β,γ(0,1). 设 Ti=Ti(X1,,Xn) 为统计量, T1T2.

容忍区间 容忍限

[T1,T2]F 的一个 (β,γ) 容忍区间, 如果 PF(F(T2)F(T1)1β)1γ.T3,T4F 的**(β,γ) 容忍上/下限**, 如果PF(1F(T3)1β)=PF(F(T3)β)1γ,PF(F(T4)1β)1γ.

形式上容忍区间和置信区间相似, 但它们实质不同. 后者是为了估计分布中的未知参数, 而前者中 b1,b2 无穷多, 我们并不关心某对确定的 (b1,b2), 而是关心 F(T2)F(T1)1β 这件事是否成立.

2 容忍区间、容忍限的求法

2.1 (,) 上处处连续的分布函数 F(x)

引理

设一维变量 XF(X), F(X) 处处连续, 则 Y=F(X)Uniform(0,1).

现设 X1,,XnX 的独立观察值, 次序统计量为 X(1)X(n). 根据引理, 若 Ui=F(Xi), 则 U1,,UnUniform(0,1). 因此若 U(1)U(n), 则 U(i)=F(X(i)). 记 Vij=U(j)U(i), 则 Vij 的密度已经在 这里 给出. 则 P(F(X(j))F(X(i))1β)=P(Vij1β)=1β1gnij(v)dv.
如果选择了 i,j 让积分不小于 1γ, 则根据定义 [X(i),X(j)] 就是 F(β,γ) 容忍区间. 一般地, 选择 i+j=n+1 (或者 n,n+2), 这样得到的区间稍微短一点.
同样地对容忍上下限, P(F(X(i))1β)=P(U(i)1β), 代入 F(x)=x,f(x)=1, 得 P(F(X(i))1β)=1β1gn,i,ni+1(v)dv,P(F(X(j))β)=0βgn,j,nj+1(v)dv.
选择 i,j 让右边的积分 1γ, 则 X(i),X(j) 就是 F(β,γ) 容忍上/下限.

2.2 正态分布

正态分布函数处处连续, 所以可以用上一节的结果. 但它比较粗糙, 因此这里把它精细化.
X1,,Xni.i.dN(a,σ2), a,σ 未知. (如果已知, 前面已经介绍了结果.) 由于估计的随机性, (β,γ) 容忍上限不见得是 X+Suβ, 而需要加入修正系数 λ=λ(β,γ). 记分布函数 Fa,σ(x), 则 Fa,σ(X+λS)1βX+λSa+σuβ, 从而问题转化为求 λ: P(X+λSa+σuβ)1γ.S=Sσ, n(Xa)σ=Y, 则 (2.1)P(YnuβSnλ)1γ. 由于 YS, Sχn12n1, YN(0,1), 从而 YnuβStn1,δ,δ=nuβ.如果能确定 λ, 使 P(tn1,δλ)=1γ, 则 λ=λn 就满足 (2.1) 了. 这样容忍上下限就是 X±λS.

对于容忍区间, 首先得到上面的容忍限, 然后根据下面的引理得到:

引理

T1,T2F(β2,γ2) 的容忍上下限, 且总有 T1T2, 则 [T2,T1]F(β,γ) 容忍区间.

近似解法: Φ(x)N(0,1) 的分布函数, 找 b 使 Φ(1n+b)Φ(1nb)=1β. 再算出 λ=n1bχn12(γ), 则 [XλS,X+λS] 近似地为 F(β,γ) 容忍区间.